#제미나이 옴니

제미나이 옴니와 3.5 플래시 데모 11선

구글 I/O 2026에서 발표된 영상 생성·편집 모델 '제미나이 옴니(Gemini Omni)'와 복잡한 에이전트 워크플로우 실행에 최적화된 '제미나이 3.5 플래시(Gemini 3.5 Flash)'의 실제 활용 데모가 공개되었습니다. 옴니는 텍스트, 이미지, 오디오, 비디오를 혼합해 고품질 영상을 생성하고 자연어로 세밀하게 편집할 수 있게 해주며, 3.5 플래시는 '안티그래비티(Antigravity)' 하네스와 결합해 대규모의 복잡한 코딩 및 멀티모달 UI 생성 작업을 빠르고 안정적으로 수행합니다. 이번 데모들은 생성형 AI가 단순 생성을 넘어 복잡한 현실의 작업을 자율적으로 수행하고 정교하게 제어할 수 있는 수준에 도달했음을 보여줍니다.

제미나이 옴니 제미나이 3.5 플래시 구글 I/O 2026

r/singularity • 64일 전

IMP 9

새로운 제미나이 옴니, 경쟁작들을 압도하다

구글 딥마인드가 텍스트, 오디오, 비디오 등 모든 형태의 입력을 받아 고품질 비디오를 생성하고 자연어 대화로 편집할 수 있는 멀티모달 모델 '제미나이 옴니(Gemini Omni)'를 공개했습니다. 이 모델은 제미나이의 방대한 실세계 지식과 물리 법칙에 대한 이해를 바탕으로 단순한 사실적인 영상을 넘어 의미 있는 스토리텔링이 가능한 영상을 제작합니다. 실무자들에게 이는 복잡한 프롬프트 엔지니어링 없이도 아이디어를 시각화하고 일관된 영상을 제작할 수 있는 혁신적인 워크플로우를 제공한다는 점에서 매우 중요합니다.

구글 딥마인드 제미나이 옴니 비디오 생성

Hacker News • 70일 전

IMP 8

구글 제미나이 옴니(Gemini Omni) 발표

구글이 텍스트, 이미지, 오디오 등 모든 형태의 입력을 조합해 자연어 대화만으로 영상을 생성하고 편집할 수 있는 멀티모달 AI 모델 '제미나이 옴니(Gemini Omni)'를 공개했습니다. 이 모델은 물리법칙이나 역사적 사실에 대한 세계 지식을 바탕으로 일관성 있는 스토리텔링이 가능하며, 복잡한 영상 편집 과정을 단계적인 대화를 통해 수행할 수 있다는 점이 가장 큰 특징입니다. 실무자 관점에서 프롬프트 가이드와 안전성 평제(Red Teaming)를 거쳐 배포되었으며, 영상 생성 및 편집 파이프라인의 혁신을 가져올 중요한 릴리즈입니다.

영상 생성 멀티모달 AI 제미나이 옴니

r/singularity • 78일 전

IMP 7

유출된 제미나이 옴니 vs 곧 폐지되는 소라 2

최근 유출된 구글의 '제미나이 옴니(Gemini Omni)' 영상 생성 모델과 현재 API로만 제공되며 곧 완전히 폐지될 예정인 오픈AI의 '소라 2(Sora 2)'의 성능을 직접 비교한 글입니다. 작성자는 두 모델에 최대한 동일한 프롬프트를 입력하여 스파게티 식사 장면, 애니메이션 액션, 칠판 수식 증명 등의 영상을 생성했으며, 독자들에게 어느 모델의 결과물이 더 뛰어난지 평가를 요청하고 있습니다.

영상 생성 AI 제미나이 옴니 소라 2